在现实世界中存在的各种田间条件下,通常会挑战准确的作物行检测。传统的基于颜色的细分无法满足所有此类变化。在农业环境中缺乏全面的数据集限制了研究人员开发强大的分割模型来检测作物行。我们提出了一个用于作物行检测的数据集,其中有11种与甜菜和玉米作物的田间变化。我们还提出了一种新型的作物行检测算法,用于在作物行场中进行视觉伺服。我们的算法可以在不同的田间条件下检测作物行,例如弯曲的作物行,杂草的存在,不连续性,生长阶段,具无金,阴影和光水平。我们的方法仅使用来自沙哑的机器人上正式摄像头的RGB图像来预测作物行。我们的方法表现优于经典的基于颜色的作物行检测基线。在农作物行检测算法的最具挑战性的田间条件下,杂草之间存在茂密的杂草,而作物行中的不连续性是最具挑战性的田间条件。我们的方法可以检测到作物行的末端,并在到达农作物行的末端时将机器人驶向岬角区域。
translated by 谷歌翻译
众所周知,很难拥有一个可靠且强大的框架来将多代理深入强化学习算法与实用的多机器人应用联系起来。为了填补这一空白,我们为称为MultiroBolearn1的多机器人系统提出并构建了一个开源框架。该框架构建了统一的模拟和现实应用程序设置。它旨在提供标准的,易于使用的模拟方案,也可以轻松地将其部署到现实世界中的多机器人环境中。此外,该框架为研究人员提供了一个基准系统,以比较不同的强化学习算法的性能。我们使用不同类型的多代理深钢筋学习算法在离散和连续的动作空间中使用不同类型的多代理深钢筋学习算法来证明框架的通用性,可扩展性和能力。
translated by 谷歌翻译
农业环境中的自主导航通常受到可能在耕地中可能出现的不同田间条件的挑战。在这些农业环境中自动导航的最新解决方案将需要昂贵的硬件,例如RTK-GPS。本文提出了一种强大的作物排检测算法,该算法可以承受这些变化,同时检测作物行进行视觉伺服。创建了一个糖图像的数据集,其中有43个组合在可耕地中发现的11个田间变化。新型的作物行检测算法既经过作物行检测性能,又要测试沿农作系的视觉伺服伺服的能力。该算法仅使用RGB图像作为输入,并且使用卷积神经网络来预测作物行面罩。我们的算法优于基线方法,该方法使用基于颜色的分割来实现场变化的所有组合。我们使用一个组合性能指标,该指标解释了作物行检测的角度和位移误差。我们的算法在作物的早期生长阶段表现出最差的表现。
translated by 谷歌翻译
变形金刚占据了自然语言处理领域,最近影响了计算机视觉区域。在医学图像分析领域中,变压器也已成功应用于全栈临床应用,包括图像合成/重建,注册,分割,检测和诊断。我们的论文旨在促进变压器在医学图像分析领域的认识和应用。具体而言,我们首先概述了内置在变压器和其他基本组件中的注意机制的核心概念。其次,我们回顾了针对医疗图像应用程序量身定制的各种变压器体系结构,并讨论其局限性。在这篇综述中,我们调查了围绕在不同学习范式中使用变压器,提高模型效率及其与其他技术的耦合的关键挑战。我们希望这篇评论可以为读者提供医学图像分析领域的读者的全面图片。
translated by 谷歌翻译
有效的早期检测马铃薯晚枯萎病(PLB)是马铃薯栽培的必要方面。然而,由于缺乏在冠层水平上缺乏视觉线索,在具有传统成像方法的领域的早期阶段来检测晚期枯萎是一项挑战。高光谱成像可以,捕获来自宽范围波长的光谱信号也在视觉波长之外。在这种情况下,通过将2D卷积神经网络(2D-CNN)和3D-CNN与深度合作的网络(PLB-2D-3D-A)组合来提出高光谱图像的深度学习分类架构。首先,2D-CNN和3D-CNN用于提取丰富的光谱空间特征,然后使用注意力块和SE-RESET用于强调特征图中的突出特征,并提高模型的泛化能力。数据集采用15,360张图像(64x64x204)构建,从在实验领域捕获的240个原始图像裁剪,具有超过20种马铃薯基因型。 2000年图像的测试数据集中的精度在全带中达到0.739,特定带中的0.790(492nm,519nm,560nm,592nm,717nm和765nm)。本研究表明,具有深入学习和近端高光谱成像的早期检测PLB的令人鼓舞的结果。
translated by 谷歌翻译
茶叶菊花检测在开花阶段是选择性菊花收获机器人发展的关键部件之一。然而,在非结构化领域环境下检测开花的菊花是一种挑战,鉴于照明,闭塞和对象量表的变化。在这方面,我们提出了一种基于Yolo的茶叶菊花检测(TC-YOLO)的高度融合和轻量级的深度学习架构。首先,在骨干组件和颈部部件中,该方法使用跨级部分密度的网络(CSPDenSenet)作为主网络,并嵌入自定义特征融合模块以引导梯度流。在最终的头部部件中,该方法将递归特征金字塔(RFP)多尺度融合回流结构和腔间空间金字塔(ASPP)模块结合在一起,具有腔卷积以实现检测任务。得到的模型在300个现场图像上进行了测试,显示在NVIDIA TESLA P100 GPU环境下,如果推断速度为每个图像的47.23 FPS(416 * 416),则TC-Yolo可以实现92.49%的平均精度(AP)在我们自己的茶叶菊花。此外,该方法(13.6M)可以部署在单个移动GPU上,并且可以进一步开发为未来选择性菊花收获机器人的感知系统。
translated by 谷歌翻译
兴趣点检测是计算机视觉和图像处理中最根本,最关键的问题之一。在本文中,我们对图像特征信息(IFI)提取技术进行了全面综述,以进行利益点检测。为了系统地介绍现有的兴趣点检测方法如何从输入图像中提取IFI,我们提出了IFI提取技术的分类学检测。根据该分类法,我们讨论了不同类型的IFI提取技术以进行兴趣点检测。此外,我们确定了与现有的IFI提取技术有关的主要未解决的问题,以及以前尚未讨论过的任何兴趣点检测方法。提供了现有的流行数据集和评估标准,并评估和讨论了18种最先进方法的性能。此外,还详细阐述了有关IFI提取技术的未来研究方向。
translated by 谷歌翻译
In this paper, we study the problem of knowledge-intensive text-to-SQL, in which domain knowledge is necessary to parse expert questions into SQL queries over domain-specific tables. We formalize this scenario by building a new Chinese benchmark KnowSQL consisting of domain-specific questions covering various domains. We then address this problem by presenting formulaic knowledge, rather than by annotating additional data examples. More concretely, we construct a formulaic knowledge bank as a domain knowledge base and propose a framework (ReGrouP) to leverage this formulaic knowledge during parsing. Experiments using ReGrouP demonstrate a significant 28.2% improvement overall on KnowSQL.
translated by 谷歌翻译
Weakly-supervised object localization aims to indicate the category as well as the scope of an object in an image given only the image-level labels. Most of the existing works are based on Class Activation Mapping (CAM) and endeavor to enlarge the discriminative area inside the activation map to perceive the whole object, yet ignore the co-occurrence confounder of the object and context (e.g., fish and water), which makes the model inspection hard to distinguish object boundaries. Besides, the use of CAM also brings a dilemma problem that the classification and localization always suffer from a performance gap and can not reach their highest accuracy simultaneously. In this paper, we propose a casual knowledge distillation method, dubbed KD-CI-CAM, to address these two under-explored issues in one go. More specifically, we tackle the co-occurrence context confounder problem via causal intervention (CI), which explores the causalities among image features, contexts, and categories to eliminate the biased object-context entanglement in the class activation maps. Based on the de-biased object feature, we additionally propose a multi-teacher causal distillation framework to balance the absorption of classification knowledge and localization knowledge during model training. Extensive experiments on several benchmarks demonstrate the effectiveness of KD-CI-CAM in learning clear object boundaries from confounding contexts and addressing the dilemma problem between classification and localization performance.
translated by 谷歌翻译
Dynamic treatment regimes assign personalized treatments to patients sequentially over time based on their baseline information and time-varying covariates. In mobile health applications, these covariates are typically collected at different frequencies over a long time horizon. In this paper, we propose a deep spectral Q-learning algorithm, which integrates principal component analysis (PCA) with deep Q-learning to handle the mixed frequency data. In theory, we prove that the mean return under the estimated optimal policy converges to that under the optimal one and establish its rate of convergence. The usefulness of our proposal is further illustrated via simulations and an application to a diabetes dataset.
translated by 谷歌翻译